Detección de menciones anidadas basada en expansión para el español

نویسندگان

  • Marcel Puchol-Blasco
  • Patricio Martínez-Barco
چکیده

Mention detection is the first module used in coreference resolution systems. Due to that, it is important that the results obtained by this module are as high as possible. Within the field of mention detection, nested mentions are the most difficult ones to detect. In this paper, we present a nested mention detection system based on expansion, a new model for detecting nested elements in NLP based on machine learning. The results obtained by our system are above the 72% in F-measure in AnCora corpus. We can not compare directly our results with other systems, since there are not exist, but if we consider that the average F-measure obtained by other systems for all mention (not only nested mentions), and that we are dealing with the most difficult mentions, we achieve good results.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Detección de esqueletos de caracteres mediante una red neuronal competitiva basada en segmentos

La esqueletización (palabra técnica procedente del vocablo inglés “skeletonization”) es un proceso mediante el cual se transforma una determinada forma u objeto de una imagen digital, compuesta de una determinada cantidad de pixeles, en un objeto basado en líneas, de forma que las propiedades topológicas del objeto se preserven. Este objeto resultante constituido por líneas se denomina esquelet...

متن کامل

Metodología basada en grafos para la identicación de perfiles de usuario

Resumen. En la presente investigación se propone un modelo para la identi cación de per les de usuario, a través de la creación y análisis de un grafo de co-ocurrencia. Se utilizan 4 corpus en Inglés: de Blogs, de Redes sociales, de Críticas y de Twitter y 2 corpus en Español: de Blogs y de Críticas para el desarrollo de los grafos. Para la creación y extracción de la información del grafo se h...

متن کامل

Impacto de la ironía en la minería de opiniones basada en un Léxico Afectivo

En este art́ıculo se describe un método sistemático que identifica la polaridad de textos en Español, aśı como el impacto de la irońıa en la mineŕıa de opiniones. Se propone una aproximación basada en un aprendizaje automático y en la extracción de caracteŕısticas a partir de un Léxico Afectivo en Español. Fue necesaria la creación de un corpus para el entrenamiento y evaluación del método propu...

متن کامل

Arquitectura Web para análisis de sentimientos en Facebook con enfoque semántico

Resumen Actualmente el potencial del análisis automático de sentimientos en redes sociales es relevante en el desarrollo de aplicaciones para múltiples propósitos. En este sentido, las publicaciones en Facebook escritas en español pueden contener información semántica relevante que permitiŕıan clasificarlas en categoŕıas de emociones, la complejidad del idioma hace que el análisis de esta infor...

متن کامل

Detección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos

Resumen. Los textos periodísticos pueden clasificarse dentro del llamado género informativo si su contenido se orienta a la objetividad (descripción de los hechos ocurridos), o en el género de opinión, si incluye elementos subjetivos (como el punto de vista o ideología del autor de la nota). Uno de los problemas que se presenta en la redacción de noticias es que en las notas de tipo informativo...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 47  شماره 

صفحات  -

تاریخ انتشار 2011